In this paper, we place deep Q-learning into a control-oriented perspective and study its learning dynamics with well-established techniques from robust control. We formulate an uncertain linear time-invariant model by means of the neural tangent kernel to describe learning. We show the instability of learning and analyze the agent's behavior in frequency-domain. Then, we ensure convergence via robust controllers acting as dynamical rewards in the loss function. We synthesize three controllers: state-feedback gain scheduling H2, dynamic Hinf, and constant gain Hinf controllers. Setting up the learning agent with a control-oriented tuning methodology is more transparent and has well-established literature compared to the heuristics in reinforcement learning. In addition, our approach does not use a target network and randomized replay memory. The role of the target network is overtaken by the control input, which also exploits the temporal dependency of samples (opposed to a randomized memory buffer). Numerical simulations in different OpenAI Gym environments suggest that the Hinf controlled learning performs slightly better than Double deep Q-learning.
translated by 谷歌翻译
深度学习可以大大提高高光谱成像(HSI)的分类精度。尽管如此,对大多数小型高光谱数据集的培训并不是微不足道的。两个关键的挑战是录音的大信道维度以及不同制造商的摄像机之间的不兼容。通过引入合适的模型偏置并连续定义通道维度,我们提出了针对高光谱成像的这些挑战进行优化的2D卷积。我们根据两个不同的高光谱应用(内联检查和遥感)评估该方法。除了显示模型的优势外,修改还增加了其他解释能力。此外,该模型以数据驱动的方式学习了必要的摄像机过滤器。基于这些相机过滤器,可以设计一个最佳摄像头。
translated by 谷歌翻译
制药行业可以更好地利用其数据资产来通过协作机器学习平台虚拟化药物发现。另一方面,由于参与者的培训数据的意外泄漏,存在不可忽略的风险,因此,对于这样的平台,必须安全和隐私权。本文介绍了在药物发现的临床前阶段进行协作建模的隐私风险评估,以加快有前途的候选药物的选择。在最新推理攻击的简短分类法之后,我们采用并定制了几种基础情况。最后,我们用一些相关的隐私保护技术来描述和实验,以减轻此类攻击。
translated by 谷歌翻译
对象检测管道包括一个捕获场景的相机和处理这些图像的对象检测器。图像的质量直接影响对象检测器的性能。如今,许多工作重点是改善图像质量或独立改善对象检测模型,但忽略了两个子系统联合优化的重要性。本文的目的是通过专注于优化针对对象检测器量身定制的输入图像来调整遥感方案中现有对象检测器的检测吞吐量和准确性。为了实现这一目标,我们经验分析了两个选择的摄像机校准参数(摄像机失真校正和伽马校正)和五个图像参数(量化,压缩,分辨率,颜色模型,其他通道)的影响。对于我们的实验,我们利用来自不同域中的三个无人机数据集,以及大小的最新对象检测器模型的混合物,可对管道参数的影响进行广泛的评估。最后,我们在嵌入式平台上实现了一个对象检测管道原型,以便根据我们的发现为构建对象检测管道提供最佳练习建议。我们表明,并非所有参数都对检测准确性和数据吞吐量都有平等的影响,并且通过在参数之间使用合适的折衷方案,我们能够为轻质对象检测模型实现更高的检测精度,同时保持相同的数据吞吐量。
translated by 谷歌翻译
在本文中,我们引入用于计算各种3D数据集之间的中间表面的新方法,例如点云和/或离散表面。传统上,通过检测计算距离功能的奇点等中间表面来获得,例如脊,三个结等。它需要计算二阶差分特性,并且还必须应用某些种类的启发式。与此相反,我们确定中表面只是计算距离功能本身,这是一种快速简单的方法。我们存在并比较快速扫描方法,矢量距离变换算法,快速行进方法和Dijkstra-Pythagoras方法在查找3D数据集之间的中间表面时的结果。
translated by 谷歌翻译